检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 基于张量神经网络的音频多语义分类方法

邢玲贺梅马强朱敏

计算机应用 2012, 32 (10): 2895-2898. DOI: 10.3724/SP.J.1087.2012.02895

摘要（784）

PDF （624KB）（477）

音频特征向量已广泛应用于音频分类的研究,该表示形式虽能有效体现音频的固有特性,但无法表示音频信息多语义特性及各语义间的相关性。提出了基于张量统一内容定位（TUCL）的音频语义表征方式,将音频语义描述表示为三阶张量,并构建多语义张量空间。在此空间中,张量语义离散度（TSD）能有效聚集具有相同语义的音频资源,通过计算各音频资源的TSD来完成对音频资源的分类,并构建了RBF张量神经网络（RBFTNN）来自适应学习分类模型。实验结果表明,在多语义分类的情况下,TSD算法的分类性能明显优于当前典型的高斯混合模型（GMM）算法；通过与支持向量机（SVM）学习模型相比可知,基于TSD的RBFTNN模型分类学习的准确率明显优于基于TSD的SVM模型。

参考文献 | 相关文章 | 多维度评价